王晶莹等:计算教育学:是什么、做什么及怎么做
作者简介:王晶莹,博士,特聘教授,青岛大学师范学院(山东青岛 266071);杨伊(通讯作者),师资博士后,上海师范大学教育学院(上海 200234);宋倩茹,硕士,研究实习员,青岛大学师范学院(山东青岛 266071);郑永和,教授,博士生导师,北京师范大学教育学部(北京 100875)。
基金项目:国家自然科学基金青年项目“学校学习环境对中学生STEM职业期望的影响机理及其改进研究”(71704116);中国科学院院士咨询项目“我国科学教育发展战略研究”(2018-Z10-A-025)。
引用:王晶莹,杨伊,宋倩茹,郑永和(2020).计算教育学:是什么、做什么及怎么做[J].现代远程教育研究,32(4):27-35,56.
摘要:随着计算机科学技术被广泛应用于教育研究,基于海量数据计算的研究范式成为教育研究的重要手段,这也引发了教育研究基本视角和价值观念的转变。计算教育学正是对这种新兴教育研究范式的概括,是以大数据为基础,以复杂计算为核心,以算力为支持,以构建教育理论、解决教育问题、揭示教学规律为目标的研究领域。对相关文献进行聚类分析后发现,计算教育学主要涉及六大热点:在线社会媒体中的学习行为和学业表现,人工智能和云计算在学习管理中的应用,教育数据挖掘和学习分析,数字化课程的评价和创新,针对教学过程的教育仿真和文本挖掘,涉及师生人格品质的数据挖掘。对典型研究案例进行剖析后发现,计算教育学研究在操作路径上具有如下共性:一是得益于体量庞大的数据,相较于精度,更追求宏观层面对数据的洞察;二是研究的起点是“基于数据”而非“基于假设”,强调让数据“开口说话”;三是在数据收集上倾向于获取“即时数据”。未来,我国计算教育学研究应当实现如下转变:从关注学的过程到关注教学过程,从研究学生认知过程到研究师生互动机制,从勤于技术突破到回归教育内涵,从借鉴国际经验到融合本土特色。
关键词:计算教育学;研究范式;教育研究;数据挖掘;机器学习
当下,计算教育学引发了国内外研究者的关注,作为一个新兴的交叉领域,它既受益于计算机科学技术的日益成熟,又为教育学解决瓶颈问题提供了新的研究范式。如今,计算教育学在国际上已取得了一系列研究成果。本文从计算教育学的内涵剖析入手,采用系统聚类分析凝练其国际研究热点,并通过多项典型研究案例呈现其研究范式的具体操作路径,进而深度反思计算教育学的现状与未来。
大数据时代为教育研究带来了新的机遇与生机,而计算教育学体现的是一种基于关联思维的研究范式,这与过去基于因果思维的研究范式有很大不同。如今,国内学者关注与探索计算教育学的兴趣日益浓厚。为准确认识计算教育学,我们不但应当从纵向的发展脉络中理解其出现的必然,还应当从横向的学科交叉中探索学科由“分立”到“融合”的机理。
1.从范式之争看计算教育学出现的必然
关于教育研究范式的争论由来已久,而“实证”与“思辨”之争是学界讨论的焦点。参照国内外学者对教育研究方法的类型划分,可以将其分为思辨研究和实证研究两大类,其中实证研究又包括质性研究、定量研究和混合研究三个子类(陆根书等,2016)。自改革开放打开“西窗”以来,两种范式之争从未平息,在争论的背后是对教育研究科学化的求索。思辨研究基于个体理性认识能力和经验,通过对概念、命题进行逻辑演绎和推理以认识事物的本质特征,故思辨研究的辩护者认为,对教育价值层面的哲学省思和追问更接近教育的本真。相对地,实证研究则是基于观察、实验和调查,对收集的数据或信息进行分析和解释,以事实为证据来探讨事物的本质属性或发展规律(姚计海,2017),故实证研究的辩护者认为,在科学的度量尺度之下,实证研究才能揭示出实然的教育。然而随着研究数量的不断增长和研究群体的日益壮大,教育思辨研究出现了良莠不齐和泛化的乱象;与此同时,以人为对象的教育实证研究本身存在不可重复性、不可验证性、研究结果无法应用于现实等问题,导致教育研究的科学性无法确保(余胜泉等,2019)。以传统的眼光看,思辨研究呈现了“应然的教育”,实证研究呈现了“实然的教育”,事实上,后者的根本亦是验证应然的教育,也就是对人类直觉、经验等的验证,与我们期望的科学的、实然的教育尚有一定距离。跨越这一距离必然要突破基于假设的研究范式,建立一种基于事实的研究范式。所以,当务之急不在于否定某一种范式,而是看到每一种范式固有的局限,探寻突破瓶颈之法。
计算机科学哲学资深学者拉斐尔·阿尔瓦拉多(Rafael Alvarado)等在“已知的已知、已知的未知、未知的未知”的知识分类中,加入第四类知识“未知的已知”,即机器经验的知识(计算机已知而人类可能未知)(Alvarado et al.,2017)。第四类知识的出现打破了人们对思辨研究和实证研究的执念,这背后蕴含着一种隐喻:教育研究仍有大片超出人类经验可抵达范围的处女地,等待新的工具去开垦。在此背景下,计算教育学破茧而出,其核心内涵就是运用计算机信息处理技术(理论、算法、软件),对过去与现在的教育数据进行定量分析,以发现和揭示教育中的规律,更好地为教育服务(孙仕亮,2015)。
事实上,计算教育学的出现从内部讲,是教育学研究范式流变的结果,而从外部讲,是社会科学发展的大势所趋。上世纪末,人们迫切需要新的范式来解决社会问题,与此同时,计算机攻克复杂问题的能力不断提升,于是1994年诞生了“社会计算”(Social Computing)。经过十余年的发展, “计算社会科学”(Computational Social Science)的概念于2009年进入学者们的视野,其始于美国哈佛大学大卫·拉泽(David Lazer)教授等15名顶级学者在《科学》杂志上的联合发文。而后,社会学家们一方面受到计算社会科学的启发,另一方面也不满足于计算社会科学的一般范式,于是基于社会学的学科特征,在2014年正式提出了“新计算社会学”(New Computational Sociology)。遵循这一路径,作为社会科学分支的教育学同样具有社会科学的共性,更有其自身的学科特征和研究需求,因而自立门户地建构起“计算教育学”的研究领域,以解决教育研究中存在的诸多问题,这也是计算社会科学发展到一定时期的必然结果。
因此,纵观教育研究范式的流变,不论是出于学科本身的诉求,还是顺应社会科学发展的潮流,托马斯·库恩(Thomas Kuhn)所言的科学共同体所共有的“信仰、价值、技术”已到了转型的关键期,基于海量数据的计算范式成为教育研究的核心方法论,教育研究的持续繁荣需要借助新技术摘取“高枝”上的研究成果。
2.从“隔岸相望”看学科融合的可能
究其语义内涵,计算教育学是“计算”与“教育”的深度融合,最终却能产生“1+1>>2”的效果。从学科类属上看,计算教育学是计算机科学技术与教育学的交叉(许新华,2019),前者在广义上类属于自然科学,后者类属于社会科学,两者长期以来“隔岸相望”,计算教育学则是两岸的融合与沟通。事实上,“计算”只是通向教育的路径、方式与手段,“教育”是计算的目标与归宿,不能用“计算”替代“教育”,“计算目标”也不等于“教育目标”,“教育”才是计算教育学安身立命的“魂魄”与“根基”(李政涛等,2019)。教育学是计算教育学的本体,计算机科学技术是其手段和功用,简言之,教育为“体”,计算机为“用”(许新华,2019)。“计算教育学”的要素模型应该围绕学习行为、认知发展、学习环境等三个教育学的基本问题进行构建(黄荣怀等,2019)。计算教育学最终指向教育学问题,故从学科性质上看,其姓“教”不姓“计”,这已成为众多学者的共识。
基于这一认识,不难建构出计算教育学在两个学科间的沟通机制。随着计算机技术的飞速发展,特别是人工智能时代的到来,学生学习的过程被详细捕捉和记录。如何让数据“开口说话”?如何应用海量的数据反哺教学?这既是新的“困扰”,亦是新的机遇。大数据并非仅指海量数据,也包含了数据存储管理技术,甚至内在地隐含了一种理解数据的方式。而数据挖掘则是从大量数据中揭示出隐含的、先前未知的、有潜在价值的信息的非平凡过程,它包括前期对数据的处理,是一个较为笼统的概念,本质上是一种支持性技术。作为人工智能核心的机器学习是一个多学科交叉领域,其专门研究计算机如何模拟和实现人类的学习行为。相较而言,数据挖掘涉及从数据收集到结果应用的全流程,而机器学习侧重于能从数据输入获得准确输出的映射函数的构建。以预测学生成绩为例,学生行为数据是大数据,从数据的收集整合到输出预测成绩的全过程是数据挖掘,其中的核心预测模型是机器学习。针对实际的教育研究,可以在明确概念的前提下,采用更为宏观的视角,把这些不同层次、不同内涵的核心概念整合起来,“打包”视为一体,进而审视“计算”与“教育”的深度融合机制。
笔者认为,从学科分野到学科交叉,再到深度融合,直至计算教育学自立门户,这一过程的关键是:计算机科学对研究范式的根本冲击,引发了教育研究基本视角及价值观念的转变。更进一步讲,是因为基于数据的研究范式的优越性被愈发广泛地接纳。事实上,这种优越性在今天已然明朗——在实际教学中,各种因素间的关系会作为数据“副产品”同时产生,研究者可以从中发现诸多用经验难以预测的关联,科学哲学家所言的“第四类知识”便源源不断地进入视野,这为研究者更全面地认识教育现象、探索教育规律,更精准地建构教育理论体系提供了关键支持。与此同时,客观的数据也让人们真正看到了“实然的教育”,并最终走向对生命的关怀,如此也就完成了技术向教育的回归,“教育”与“计算”也便可以实现由隔岸相望到深度融合的关键飞跃。
3.对“计算教育学”的界定
计算教育学是计算社会科学的一个分支,与之并列的还有计算政治学、计算经济学、计算传播学和计算社会学等。国外学者将计算社会科学定义为“以计算为媒介,以不同规模的社会团体为着眼点,针对社会学领域开展的跨学科研究”,其研究对象小至个体行为者,大到社会群体(Cioffi-Revilla,2017)。显然这是突破了“数据”限制的广义界定方式,然而,目前的计算教育学研究尚未突破大数据研究范式的界限。教育大数据是计算教育学的研究对象,构建精准或精确的教育理论是计算教育学的研究目的(李政涛等,2019)。综合国内外已有理论和应用研究,笔者认为,狭义地讲,计算教育学就是以大数据为基础、以复杂性算法为核心、以算力为支持,通过信息加工范式构建精准教育理论、解决教育问题、揭示教与学规律的研究领域。当然,将复杂性算法引入教育研究是计算教育学的核心,却并非其唯一特征,“计算”作为对教育信息进行加工的重要工具性手段,使得计算教育学同样依赖于数学、统计学等方法。也就是说计算教育学研究并不排斥传统实证研究范式的运用,但“复杂性算法”是甄别研究是否属于计算教育学范畴的一个关键标准。
复杂算法是计算教育学的核心,其必定要基于大数据,借助于数据挖掘、机器学习等技术,因此这些核心概念与“教育”的联合可以作为判定计算教育学研究的条件。笔者在Web of Science核心合集数据库中以“大数据(Big Data)+教育(Education)”“数据挖掘(Data Mining)+教育(Education)”“机器学习(Machine Learning)+教育(Education)”作为主题词,并将类别限定为教育研究、学科教育、社会学、家庭研究、心理学等教育学科相关领域,截至2019年12月9日,经筛选获得2139篇文献作为分析样本。将其以纯文本格式导入Bicomb软件并进行关键词提取,以绘制词篇矩阵和共现矩阵。在采用SPSS 22.0进行系统聚类时,词篇矩阵所得到的聚类结果及其稳定性优于共现矩阵,因此选择词篇矩阵进行系统聚类分析(隋明爽等,2016)。将词篇矩阵导入SPSS,利用其内置的Ochiai系数将词篇矩阵转换为相关矩阵,以揭示热点词之间的关联程度。为避免干扰后续分析,进一步构建相异矩阵并将其导入SPSS,采用多维尺度分析(算法为ALSCAL,形状为正对称,度量模型为欧氏距离)获得的聚类结果如图1所示。图1中横坐标表示关键词在研究网络中的外部影响力(即中心程度),各关键词对应的横坐标值越大,说明聚类之间的相互影响更广泛,即处于整个研究网络的中心;纵坐标表示研究体系的内部成熟度,纵坐标值越大,则说明聚类内部的联系更紧密,即研究体系趋向成熟(王凌燕等,2011)。
利用SPSS内置的K-均值聚类功能,对关键词进行聚类分析后,结合关键词的语义和组间距离,最终将国际计算教育学研究的关键词划分为6个核心领域:领域一,在线社会媒体中的学习行为和学业表现;领域二,人工智能和云计算在学习管理中的应用;领域三,教育数据挖掘和学习分析;领域四,数字化课程的评价和创新;领域五,针对学习过程的教育仿真和文本挖掘;领域六,涉及师生人格品质的数据挖掘。上述领域所包含的特征关键词如表1所示,每个特征关键词后括号内的数字为频次和中心度,分别表示该关键词的热度和重要程度;每个类别中特征关键词按照其与该类别研究主题间相关性的强弱进行排序。
(注:括号中第1个数字为关键词的频次,第2个数字为关键词的中心度。)
领域一主要分布在第二象限,是计算教育学中起步较早的一个研究领域,其主题内部的连接紧密,形成了相对成熟的研究体系和研究范式。该领域的研究主题为在线社会媒体中的学习行为和学业表现,主要基于Facebook、YouTube等社交平台中的大数据研究学生的学习行为模式及学业表现。例如,丹尼尔·乔治(Daniel George)等采用在Facebook上推送压力管理内容的方式来缓解学生学业压力,并基于产生的数据对其效果进行研究(George et al.,2013)。张思等收集了教师的在线学习行为数据,进而分析网络专业学习社区中教师的动机信念、动机调节与学习参与之间的关系(Zhang et al.,2019)。
领域二主要分布在第四象限,其研究总体呈现影响范围较大但内部分散的特征,该领域具有进一步发展的空间,但领域内研究间的融合性有待增强。该领域的研究主题为人工智能和云计算在学习管理中的应用,即通过云计算和人工智能技术为学习者和教育管理者提供便捷有效的学习管理途径。例如,易卜拉欣·阿拉帕伊(Ibrahim Arpaci)基于云计算发现学生的信息管理行为(检索、存储、共享、应用)与其态度显著相关,建议通过设计真实的学习环境来协助学生进行个人信息管理(Arpaci,2019)。捷克生命科学大学开发了一种利用人工智能技术对学习进行管理的实验工具,并研究其在隐性知识获取上的作用(Pavlicek et al.,2014)。
领域三主要分布在第一象限和第二象限,该领域的研究主题为教育数据挖掘和学习分析,在线教育(如MOOCs)中的数据挖掘是其研究热点和中心。学习分析和机器学习也属于该区域,其研究虽呈现出日渐成熟的趋势,但影响力仍有待进一步提升。机器学习和数据库是教育数据挖掘的两大支撑技术,特别是前者为在线教育中的数据挖掘研究提供了重要方法。例如,玛利亚·卡塔米苏(Maria Cutumisu)在加拿大西部一所大学开设的“教育技术导论”本科课程中,利用基于无监督机器学习技术的主题建模方法,从职前教师的反思文本中提取主题特征,进而确定其主题(Cutumisu et al.,2019)。
领域四主要分布在第一象限和第四象限,其研究主题可概括为数字化课程的评价和创新。数字化课程具有较强的多学科交叉特征,其研究的影响范围较广。例如,吉利·霍夫曼(Jirí Hoffman)基于教学系统设计原则开发电子学习课程,其可以提供不同层次的信息与学生的兴趣深度相匹配,并提出了一种被称为“简单机器”(Simple Machines)的具体任务,通过强化学生在物理学习中的问题解决情境,来帮助他们获得更好的学习体验(Hoffman,2013)。
领域五主要分布在第四象限,少量分布在第一、三象限,该领域的研究主题为学习过程中的教育仿真和文本挖掘,其研究的内部联系有待进一步加强。例如,邢旭等针对学生难以清晰表达相关概念的问题,利用计算机仿真技术构建更加真实的学习环境,并让学生通过合作探究的方式完成相关任务。实证研究的结果表明,学生在进行推理时的表达得到改善,其学习行为也得到规范(Xing et al.,2019)。
领域六集中在第三象限,该领域的研究主题涉及师生人格品质的数据挖掘,其处于整个计算教育学的边缘,内部联系不够紧密,相互影响程度也较弱。20世纪80年代以来,随着研究者们在人格描述模式上基本达成共识,“大五人格”(Big Five)模型被广泛应用于人格研究。领域六的主要研究为利用大数据和数据挖掘技术,结合“大五人格”模型研究教育主体的人格品质及其在性别上的特征差异。如杰罗尔·柯万(Jeral Kirwan)基于“大五人格”模型,通过大数据分析并探讨了大学生的自我导向与其他人格特质之间的关系(Kirwan,2014)。对教师人格品质的分析也是该领域的研究重点,如拉扎·扎伊迪(Raza Zaidi)等基于大数据分析了教师的人格品质与其工作投入量间的关系,发现教师性格的开放程度与工作投入度显著相关(Zaidi et al.,2013)。
遵照计算教育学的定义,本研究选择同时符合“以大数据为基础”“以复杂算法为核心”“以算力为支持”“解决教育学问题”“揭示教与学规律”等条件的多个典型案例,聚焦其操作路径,从对学生认知过程的模拟和对在线学习行为数据的挖掘两个方面来进行整合分析,以求透过其具体的研究过程,形象地回应“计算教育学怎么做”这一问题。
1.对学生认知过程的模拟
传统的科学教育研究常通过学生的学习结果反推其认知过程,却难以反映学生在横向维度上的跨学科学习和纵向维度上的科学思维形成过程,因而限制了对实验结果的完整解释。理查德·兰姆(Richard Lamb)将计算教育学引入科学教育研究,形成了多项重要成果。将教学过程视为一种机制,是他进行一系列教育模拟的前提。
在一项关于“科学教育中学生认知过程的计算模型”(Lamb et al.,2014)的研究中,兰姆等人建立了一个能够模拟学生在科学课堂中完整认知过程的计算模型。该模型基于对认知属性的识别,通过融合认知诊断理论和项目反应理论(Item Response Theory,IRT)的测量框架,为构建的人工神经网络(Artificial Neural Networks,ANN)模型提供输入。该人工神经网络模型是整个计算模型的核心组成部分,可基于多个相互联系的认知属性的交互作用,对学生在科学任务中的认知反应进行处理。首先,他在研究中模拟了一个认知训练过程以对学生的学习行为进行干预,并通过分层抽样的方式随机选择学生参加对照试验。该试验收集学生在完成三维严肃教育游戏(Serious Educational Games,SEG)过程中产生的数据,并建立学生任务与认知模型(Student Task and Cognition Model,STAC-M),该模型提供了一种可以控制环境刺激并跟踪学生游戏过程的方法。而后,通过Q矩阵对SEG过程中的数据进行编码,并提交到STAC-M模型中进行训练,再利用模型的训练数据进行拟合分析,以验证认识属性的层次结构(即完成任务的行为组合)。最后,以学生执行任务是否正确以及完成任务所使用的属性是否为目标属性来量化批判性推理。图2归纳了STAC-M的训练过程和后续的模拟干预过程。该研究不但表明使用有针对性的认知属性方法可以提高学生完成任务时的成功率,其构建的计算模型也为教育研究提供了一种检验教育理论的手段。
在另一项应用研究中,兰姆等人发现教与学的规律与一类被称作多目标进化算法(Multi-Objective Evolutionary Algorithms,MOEA)的训练过程相似,故就多目标进化算法如何与认知计算模型协同工作这一问题进行探究,以模拟学生在科学课上解决推理问题的认知过程(Lamb et al.,2017)。该研究对是否加入MOEA的STAC-M进行了对比实验,研究结果表明加入MOEA的模型更加快速、有效。从方法论的角度讲,教育学领域的研究者对这类算法表现出日益浓厚的兴趣。
同样是在科学教育的背景下,兰姆还比较了三维严肃教育游戏、二维网络实验室和传统课堂教学等情景下的学习效果(Lamb,2016)。该研究依旧采用分层抽样的方式随机选择实验样本,并基于STAC-M计算和分析了认知系统关键要素(如心理旋转、空间可视化)的潜在作用机制,研究发现,三维严肃教育游戏对学习有显著促进。这可能是缘于空间域(Spatial Domain)对学习者认知的重构,使其认知通道得到拓展,因而降低了其在思维过程中的认知负荷。
2.对在线学习行为数据的挖掘
随着数字化系统在学习中被越来越多地使用,有关学习过程和环境的数据源源不断地产生。因此,借助于工具和技术的创新,对在线学习行为数据进行挖掘,研究者可以从中获得关于学习的重要见解。这正是前文所述的第四类知识,是只有基于教育大数据才能发现的潜在规律,也是目前国际上关于计算教育学的又一类经典应用领域。
安托万·范登比姆(Antoine Van den Beemt)等从个人建构主义的视角出发,将MOOC中的学生活动视为学习行为与学习过程的结合,以“流程挖掘:行动中的数据科学”(Process Mining:Data Science in Action)课程为例,对MOOC平台上产生的学生数据进行分析,以探究“及格”和“不及格”学生在课程周期内学习活动的差异(Van den Beemt et al.,2018)。研究使用聚类分析、均值分析以及运用过程挖掘技术对活动聚合计数、特定课程项目计数和活动顺序进行分析后,发现四类值得关注的学生群体,图3为这四类学生群体的学习行为随时间分布的状况。研究将参加MOOC学习的16224名学生均看作独立案例,共涉及285036个学习活动事件。图3中的每一个点代表学生在特定时间发生的一个学习事件,横向为特定学生的所有学习事件,纵向以周为单位对学习事件进行分隔,左边的拱形部分边缘显示出不同学生产生首次学习事件的时间先后顺序,点密度可体现出学生的学习事件频度。利用过程挖掘技术对学生的学业成绩和学习事件进行分析后发现,学业成功的学生表现出更稳定的学习行为,这些学习行为多与视频观看有关,而与学习事件的时间安排无关。上述分析结果可为教师优化在线教学提供有效的指导。
同样是基于有关学生行为的海量数据,徐星等(Xu et al.,2019)提取了4000名学生的互联网使用行为数据,并对在线时长、互联网流量和连接频率等特征进行归一化处理,而后利用决策树、神经网络和支持向量机等机器学习算法对其学习成绩进行预测和分析。研究结果表明,学生使用互联网的行为模式对其学业成绩具有显著影响,网络连接频率与学习成绩正相关,而网络流量和在线时长与学习成绩负相关。这与传统经验中对在线学习规律的认识有所差异,其原因在于过于复杂的学习行为会对学习效果造成负面影响。此外,研究还发现随着特征数量的增加,预测精度总体呈现上升趋势。该研究不仅揭示了学生的互联网使用行为与学习成绩间的关系,而且表明通过机器学习方法能够对学生的学业表现进行预测。
此外,数据挖掘方法还可以用于学习资源的精准推荐,以满足学生的个性化学习需求。魏鹏程等(Wei et al.,2019)基于对用户偏好行为数据的分析构建了面向在线教育的个性化推荐系统,并对多个推荐模型的效果进行对比。具体地讲,就是利用产品属性挖掘方法确定推荐系统的推荐标准集,然后利用个性化推荐算法对用户偏好进行建模,通过分析用户偏好与推荐标准间的相似度来产生精准推荐结果。实验结果表明,基于用户距离相似度的多准则推荐算法效果最好,可有效提升推荐的精准性。
综合分析上述具有代表性的研究案例的过程和结果,可以看出,尽管计算教育学研究尚处于萌芽期,但其在研究的设计和方法上都与传统教育研究存在较大差异。第一,从研究数据的特征来看,计算教育学研究得益于体量庞大的数据,相较于精度,其更追求在宏观层面对数据的洞察。第二,从研究过程的特征来看,计算教育学研究的起点是“基于数据”,这有别于传统教育研究“基于假设”的研究范式,上述案例无一不是让数据“开口说话”,这与“通过数据证明假设”的传统研究过程有较大差异。第三,从数据收集的途径来看,计算教育学研究倾向于获得“即时数据”,这不仅与传统教育研究中为验证假设而收集数据的方式存在明显区别,也不同于传统教育研究在数据收集后往往不进行实时分析和反馈的习惯。可以看出,计算教育学针对教育问题的研究是基于对教学过程的模拟和分析来展开的,其背后的动因是“计算主义思潮”,即是将宇宙视为巨型计算装置,微观层面上教育现象的多样性是算法复杂程度不同的外部表现。因此,上述研究案例均蕴含了计算教育学研究范式全新的算力隐喻及其独特的算法特征,随着计算教育学向实践领域的纵深发展,其理论体系会更加趋于完善,其方法论基础也会日益坚实。
计算教育学是一个成长中的新兴领域,计算机科学技术的每一次突破都为其发展注入动力。早在30年前,叶澜、陈桂生、瞿保奎等学者就极具前瞻性地提出,从其他相关学科中吸取新的思维方式和移植研究方法,是教育研究方法向科学化目标前进中迈出的最富有生气的一步。在计算机尚未普及的时代,他们就乐观地指出,计算机等现代化技术手段在教育研究中的普遍采用虽然还有一个过程,但是毕竟开始了(叶澜等,1989)。20年之后,靳玉乐再次强调跨学科合作对于教育科学发展的重要性,并指出这有利于产生教育科研的创新点(顾明远等,2009),这既是研究内容的创新,更是研究范式的创新。由此观之,不论是从研究范式科学化的走向看,还是从教育学自身发展的需求看,抑或是从跨学科合作研究的趋势看,将教育与计算相结合以解决教育理论与实践问题的构想绝非偶然,它在我国学者几十年来的反思与呼吁中萌发已久。而在今天,我们顺应社会科学研究发展的潮流,找到了“计算教育学”这一跨学科结合的明确路径和方向,在此,有必要从学科内涵和教育学发展的需求出发,对计算教育学的现状与未来进行审视。
1.由关注学的过程到关注教学过程
我国学者裴娣娜对“教”与“学”的深层关系作了完整阐释:教学的根本目的、出发点和归宿都要体现、落实于学的状态,教的必要性建基于学的必要性,教的现实性取决于学的可能性,教的准备依存于学的准备(裴娣娜,2007)。这也就意味着在教与学的矛盾关系中,学是主要方面,教则是次要方面,但若脱离了矛盾的一个方面而单独讨论另一个方面就很难揭示出教学过程的本质。纵观当前的计算教育学研究,不难看出,不论是利用计算机模拟人的认知过程,还是通过数据挖掘寻找行为特征和学习偏好,都是在针对学的过程进行研究。特别是在以MOOC为背景的研究中,学生自始至终是在与视频等资源进行互动,教师的地位已被学习资源所削弱,教学过程的复杂性愈发突出。上述研究取向在某种程度上是源自西方教育研究范式中“关注学胜于关注教”的传统,也是因为学生的在线学习行为数据更易于收集和监测。而在大量非在线的教学情境中,教师的“教”是不可或缺的部分,教学过程是教师的“教”、学生的“学”以及教学环境等共同构成的有机整体。因此,计算教育学研究应立足于教育的真实情境和过程,把握“教的过程符合、适应于学的过程”的内在逻辑,在利用信息技术揭示学习规律和认知过程的同时,能进一步对“教”的效果进行量度。“教”的任务是否完成,“教”的目的是否达到,教师的教学是否有效,最终都要落在“学”的终态上。研究者只有深刻认识到教与学的依存关系,计算教育学研究才能突破学的单一视角,突破在线学习的单一情境,在更广泛、更普遍、更真实的教学情境中发挥出更大的价值。
2.由单一认知过程到双向互动机制
承接前文对教学过程的讨论,正是因为计算教育学对“教”的研究不足,导致了在教学互动研究上的缺失,甚至不少研究用“人机互动”来代替 “师生互动”,这在很大程度上限制了研究成果的推广。朱永新认为关注鲜活的教育生命才是教育科研的走向,而其关键之一就是关注教室里发生的事情(顾明远等,2009)。随着在线学习的发展,纵使教师地位在今天似有弱化的趋势,但不可否认的是,在可预见的将来,正规教育仍将以课堂教学作为主要形式。因此,面对课堂教学复杂多变的教学过程,应当将教师与学生同时作为核心对象,将师生互动作为分析课堂教学的重要突破口。如若脱离了人与人的关系而只针对人与物的关系,仅就学习进行的研究也就背离了教学的本质。虽然此类研究所取得成果具有一定的借鉴价值,但师生间的互动不仅可以从学生的认知过程这一微观视角去解读,还应当基于社会和文化的立场,就人际交互中的社会知觉、情意感染、行为适应与调节乃至价值涵化与认同等方面进行探究(裴娣娜,2007)。一旦深入到“互动”层面,就意味着研究会涉及到教师、学生等多个主体,且由于教学和学习具有复杂的非线性关系,因而难以通过传统的统计模型(如回归分析)进行建模(Crooks et al.,2012)。由于构建独立的教学模型具有相当的复杂性,研究人员往往难以将教与学的相互作用整合为单个系统,这是教学研究中难啃的硬骨头,也注定是计算教育学面临的复杂问题。因此,国内外研究者应当从单一的学生视角中解放出来,把在学生认知过程模拟中获得的研究成果作为优化教学和设计教学的依据。具体而言,可以从以下几个方面入手:一是从“怎样更好地学”出发,观照“如何更好地教”;二是从学生认知的微观过程出发,探索师生互动的机制;三是从提升计算机的模拟水平出发,解答教学研究中更为复杂且更具不确定性的问题;四是从单一的研究对象出发,逐步深入探讨以师生互动为基础的课堂生态。
3.由勤于技术突破到回归教育本质
计算教育学自其出现便受到学界的广泛关注。从研究案例中不难看出,西方计算教育学的研究成果是服务于教育的,这有赖于其研究者的知识结构。西方最早开展计算教育学研究的是具有较高技术水平的教育学者,其研究是在用技术的“内核”解决教育问题。例如兰姆利用计算机模拟学生认知过程的研究,其最终提供的是一种检验教育理论的方法。类似成果最大的贡献不在于算法或教育产品本身,而是解决了教学中真实存在的问题,并为教育理论的建构和完善提供支持。而我国的计算教育学研究的先行者普遍具有计算机科学背景,因此多将教育问题作为研究的情景,其对技术改进的兴趣远比对教育问题的兴趣要浓厚。这便回归到一个基本问题,计算教育学是以技术本身的突破为最终成果,还是以揭示教育规律、优化教学过程为最终成果?该问题从根本上决定着计算教育学研究的发展路径。从教育技术哲学的角度讲,计算教育学研究的对象是教育活动,而教育活动是教育的主体性活动,技术的属性、结构、功能和规律等因素作用于教育,使教育发生变化并转化为教育的本质力量(颜士刚,2010)。这也就意味着技术有能力改变教育内在的、根本的属性(目的、方式、功能等),但这并非是对主客体关系的彻底颠覆。从教育目的的角度讲,教育目的反映了一定社会培养人的总要求,有多少教育价值取向就有多少关于教育目的的取向(陈桂生,2012)。关于此问题的讨论层出不穷,最终都落脚于对人的一般教养规格和社会角色教养规格的争论,其中的关键词正是“人”。所以不论从哪个角度来探讨技术与教育的关系,都再一次证明,教育问题才是计算教育学的根本,而教育则是它的灵魂。如果把计算教育学比喻为一幅画,那么技术便是作画的工具,教育却不是画布而是画的内容,技术的繁荣必然要回归教育的本质和规律。
4.由借鉴国际经验到融合本土特色
国际上成熟的计算教育学研究案例为我们带来了诸多启示,具有极强的指导和借鉴意义。在处理本土研究与国际经验间关系的问题上,顾明远先生既反对“西方中心主义”,也不赞成“东方中心主义”,认为只有结合中国国情,走自己的路,才能真正实现中国教育科学的现代化(顾明远等,2009)。基于此,我们要明确认识到国内外计算教育学研究存在的根本差异。这种差异主要源于研究者具有不同的知识结构和学科背景,其也为新兴交叉领域的生长提供了不同质地的“土壤”。此外,由于研究范式和研究传统上的差异,中外计算教育学研究必然呈现不同的取向和特色,而我国应当立足于国情和教育传统来发展计算教育学。相较而言,西方教育研究具有深厚的实证研究根基,西方教育研究者对数据的敏感和对量化的热情使其更能适应基于数据的研究范式。而我国教育研究者长于思辨,这是提倡“穷理悟性”的一种根深蒂固的思维方式,因此,计算机科学领域的研究者成为了计算教育学在中国的“先驱”。计算教育学在我国的推广是以信息技术进步、教育产品更新为驱动的,研究集中于对技术的探讨;而其在西方的研究虽亦是基于技术,但本质上是将技术作为解决教育问题的手段,使其服务于教学。我国也需要让计算教育学回归教育的本质,而目前最有效的方式就是开展跨学科合作,让不同学科背景的学者同侪携手,将计算机科学与教育科学中的理论和方法结合起来,基于数据科学解决教育中存在的瓶颈问题。此外,我们要在借鉴西方教育研究之长的同时发挥我国学者的优势,探索出一条与我国的教育研究传统相契合,与我国研究者的专业结构相适配的具有中国本土特色的计算教育学研究之路。
封面图片来自互联网